📦 RAG Vector Base Writer v7 🚀

Управление базами
знаний AI агента

Комплексная система для работы с векторными базами данных. Загружайте документы, обрабатывайте контент с помощью AI, векторизируйте и ищите семантически. Полная интеграция с системой самообучения.

3
API Endpoints
4
Режима работы
6
Типов файлов
5
Векторных БД
768
Размер вектора
📄 Мультиформатная загрузка
🤖 AI-фрагментация
🧬 Векторизация Gemini
🔄 Self-Learning Stats

😤 Проблемы управления знаниями

Почему ручное наполнение базы знаний — это боль

📁

Разрозненные форматы

Документы в PDF, Word, Excel, презентациях... Каждый формат требует своего парсера. Собрать всё вместе — часы ручной работы.

✂️

Неправильная фрагментация

Разбить текст на чанки просто? Нет. Разорвать посреди мысли — убить семантику. Слишком большие куски — плохой поиск.

🔍

Плохой семантический поиск

Без качественных эмбеддингов и правильных индексов поиск по базе знаний превращается в лотерею.

☁️

Файлы разбросаны

Часть документов в Google Drive, часть в Dropbox, что-то в OneDrive. Собрать всё в одном месте — квест.

🔄

Нет версионности

Обновили документ — как обновить запись в базе? Удалить старое, добавить новое, отредактировать существующее?

📊

Нет статистики

Сколько записей в базе? Какие таблицы активнее всего обновляются? Как работает самообучение? Полная неизвестность.

✨ Ключевые возможности

Всё что нужно для управления знаниями AI агента

📥

Мультиформатная загрузка

PDF, DOCX, XLSX, CSV, TXT, PPTX — все популярные форматы документов. Загружайте файлы напрямую или по URL из облачных хранилищ.

🤖

AI-обработка контента

Интеллектуальная фрагментация с помощью Gemini AI. Автоматическая генерация метаданных: категории, ключевые слова, темы.

🧬

768-мерная векторизация

Эмбеддинги через Google Gemini Embeddings. HNSW индексы в Supabase для молниеносного семантического поиска.

🗄️

Двойное хранение

Структурированные таблицы в PostgreSQL + векторизация в Supabase. Максимальная гибкость для любых задач.

🔒

Безопасность

API-ключ авторизация, rate limiting (30 req/min), валидация таблиц и режимов. Защита от несанкционированного доступа.

📊

Self-Learning Stats

Детальная статистика самообучения: циклы, диалоги, одобренные/отклонённые обновления, активность по таблицам.

🔄 4 режима работы

Полный контроль над данными в векторных базах

APPEND

Добавление новых записей в конец таблицы без удаления существующих. Идеально для постепенного пополнения базы знаний.

Безопасное добавление
🔄

REPLACE

Полная очистка таблицы и замена всех данных новым контентом. Для полной перезаписи базы знаний.

Полная перезапись
✏️

EDIT

Обновление конкретной записи по ID. Для точечных изменений отдельных записей без затрагивания остальных.

Требует editId
🗑️

DELETE

Удаление записи по ID с каскадным удалением из связанных таблиц (document_rows, document_metadata).

Каскадное удаление

📄 6 типов файлов

Поддержка всех популярных форматов документов

📄

PDF

Extract PDF Text node

📝

TXT

Direct text extraction

📘

DOCX

ZIP → XML → Parse

📊

XLSX/XLS

Dual storage mode

📋

CSV

Table + Vector

📑

PPTX

Extract slides text

☁️ Облачные источники

Автоматическое распознавание и конвертация URL

📝

Google Docs

docs.google.com

→ DOCX export
📊

Google Sheets

spreadsheets

→ XLSX export
📑

Google Slides

presentation

→ PPTX export
☁️

Google Drive

drive.google.com

→ Direct download
📦

Dropbox

dropbox.com

→ dl=1 parameter
💾

OneDrive

onedrive.live.com

→ Direct support

🤖 AI-обработка контента

Интеллектуальная фрагментация и генерация метаданных

🧠

Модель обработки

Модель Gemini 3 Flash
Temperature 0.2
Embeddings gemini-embedding-001
Chunk Size 1500 символов
Dimensions 768
📏

Правила фрагментации

Размер фрагмента 200-1000 символов
Группировка списков ✅ Включено
Сохранение контекста ✅ Включено
Команда [FULL] Сохранить целиком
🏷️

Автометаданные

category Категория контента
keywords Ключевые слова
topic Тема фрагмента
technique Техника/метод
stage Этап воронки

🗄️ 5 Векторных баз данных

Supabase + HNSW индексы для семантического поиска

📚

knowledge_base

База знаний о продукте — цены, функции, алгоритмы

📜

interaction_policies

Политики взаимодействия — каналы, правила, ограничения

💼

sales_strategies

Стратегии продаж — аргументация, возражения, закрытие

📱

contact_capture

Методы захвата контактов — progressive disclosure

🎭

conversation_scenarios

Сценарии диалогов — use cases, эскалация, ветвление

🔗 Интеграция с Self-Learning

Полная синхронизация с системой самообучения AI агента

🧠
AI Self-Learning
📦
Vector Base Writer
🗄️
Supabase Vector
🤖
AI Core Agent

Замкнутый цикл улучшений

Система самообучения анализирует диалоги, генерирует предложения по улучшению промптов, валидирует их и через Vector Base Writer применяет к векторным базам. AI Core Agent сразу начинает использовать обновлённые знания. Эндпоинт /get-learning-stats показывает детальную статистику всего процесса.

💎 Преимущества системы

Почему Vector Base Writer — это правильный выбор

Быстрая загрузка

Один API-вызов для загрузки документа любого формата. Система сама определит тип и обработает.

🧠

Умная фрагментация

AI сохраняет семантическую целостность текста. Связанные мысли не разрываются посреди предложения.

🔍

Точный поиск

768-мерные эмбеддинги и HNSW индексы обеспечивают молниеносный семантический поиск.

🔄

Гибкое управление

4 режима работы — добавление, замена, редактирование, удаление. Полный контроль над данными.

📊

Прозрачная статистика

Эндпоинт статистики показывает всё: циклы обучения, обновления, активность по таблицам.

🔒

Надёжная защита

API-ключи, rate limiting, валидация. Ваши данные под надёжной защитой.

📋 Технические характеристики

Ключевые параметры системы

3
API Endpoints
4
Режима
6
Типов файлов
5
Векторных БД
768
Dimensions
30/m
Rate Limit